Nat Biotechnol:科学家开发出能学习如何识别出引发人类疾病的嵌合体突变的计算机程序-焦点热文

来源:生物谷原创 | 2023-01-13 11:45:55 |


【资料图】

基因突变会导致数百种未解决和无法治疗的人类疾病,其中在一小部分细胞中所发生的DNA突变—嵌合体突变(mosaic mutations)非常难以检测,因为其仅会在极少比例的细胞中存在。目前的DNA突变软件检测器尽管能对人类基因中的30亿个碱基进行扫描,但却并不适合粪便隐藏在正常DNA序列中的嵌合体突变;通常情况下,医学遗传学家必须通过肉眼查看DNA序列从而试图识别或证实嵌合体突变,这是一项非常耗时的工作,其往往充满了很多错误的可能性。

近日,一篇发表在国际杂志Nature Biotechnology上题为“Control-independent mosaic single nucleotide variant detection with DeepMosaic”的研究报告中,来自加利福尼亚大学等机构的科学家们通过研究描述了一种新方法,其或能“教育”计算机学习如何利用称之为深度学习技术的人工智能手段来寻找嵌合体突变。深度学习有时也被称之为人工神经网络,其是一种机器学习技术,能教授计算机去做人类与生俱来可以做的事情,比如通过大量的信息来进行学习等。相比传统的统计学模型而言,深度学习模型能利用人工神经网络来处理加工视觉上的数据,这些模型的功能类似于人类的视觉处理,其具有更高的准确性以及对细节的关注,从而就会促进计算能力的巨大进步,包括对突变的检测能力。

医学博士Joseph Gleeson说道,目前我们未解决的一个例子就是局限性癫痫(focal epilepsy);癫痫影响着4%的人群健康,而且大约四分之一的局限性癫痫患者对普通的药物疗法并没有反应,这些患者往往需要通过手术切除大脑中短路的病灶部分来阻断癫痫的进展,在这些患者中,其大脑中的嵌合体突变往往会引发癫痫病灶。研究者表示,他们曾有很多无法发现病因的癫痫症患者,但一旦将称之为“DeepMosaic”的方法应用到基因组数据中,就会让突变变得非常明显,这或许就能允许研究人员改善特定形式癫痫中DNA测序的灵敏性,从而就有望帮助开发出治疗人类大脑疾病的新方法。

科学家开发出能学习如何识别出引发人类疾病的嵌合体突变的计算机程序。

图片来源:Nature Biotechnology(2023). DOI:10.1038/s41587-022-01559-w

准确检测嵌合体突变是医学研究中开发治疗很多疾病的新型疗法的第一步;这项研究中,研究者表示,他们对DeepMosaic技术在整个基因组中几乎20万个模拟和生物学突变上进行了训练,直到最后他们才对其从此前并未遇到过的数据中检测突变的能力感到满意。为了训练计算机,研究人员提供了值得信赖的嵌合体突变案例以及很多正常的DNA序列,并且教授计算机如何识别出差异。通过对较为复杂的数据集进行反复训练和再训练,并在十几种模型中进行选择,计算机最终就能比人眼和此前所使用的方法更好地识别出嵌合体突变;此外,研究人员还在此前并未见过的多个独立的大型测序数据库中对DeepMosaic进行了测试,结果发现其表现超越了此前的方法。

研究者Xin Xu说道,DeepMosaic在从基因组序列和外显子组序列中检测嵌合体突变的能力超越了传统工具,而且利用深度学习模型所抓取的突出的视觉特征与专家们在手动分析突变体时重点关注的内容非常相似。如今DeepMosaic能免费提供给全球的科学家们,其并不是单一的计算机程序,而是一个开源性平台,能帮助其它科学家们通过训练自己的神经网络老实现利用类似的基于图像的设置,更有针对性地检测靶向突变。

综上,本文研究结果表明,DeepMosaic或许能代表一种用于非癌症样本的精确嵌合体突变体分类器,并且能作为当前方法的替代技术或补充来发挥作用。(生物谷Bioon.com)

原始出处:

Yang, X., Xu, X., Breuss, M.W.et al.Control-independent mosaic single nucleotide variant detection with DeepMosaic.Nat Biotechnol(2023). doi:10.1038/s41587-022-01559-w